﻿ Răspunsuri la subiectele de IA Sesiunea de licență 2018 Dan Cristea, Ionuț Pistol, Diana Trandabăț, Mădălina Răschip Subiectul 1: Rețele semantice descriptive Taxonomii Concepte și instanțe Relația ISA Valoarea regăsită prin navigare în reţea în lungul lanţului de relaţii semantice R1 … Rk, plecând dintr-un nod dat Clase și instanțe • O clasă (concept): un set care conține indivizi • Un individ (instanță) poate aparține la mai multe clase • O ierarhie superclasă-subclasă se numește tahonomie Rețelele semance descripve permit reprezentarea economică ò Proprietăţile: ò explicite – la nivelul conceptual ò implicite (moștenite) – la nivelul referențial ò Interogări: ò care este închiderea tranzivă a relaţiilor taxonomice ISA ale unui nod din reţea? ò ce valoare este ataşată prin relaţia semancă R nodului n? ò care este valoarea regăsită prin navigare în reţea în lungul lanţului de relaţii R1 … Rn, plecând din nodul n? ò care este calea de relaţii semance ce se poate stabili între două noduri n1 şi n2? 4 Interogări într-o rețea semancă masă are-masă e-făcut-din are-dens material densitate obiect-ﬁzic volum 2500 are-vol are-dens ﬁer lemn 0 8 2 4 corp-geometric are-dens 1000 are-înălţime dimensiune are-rază are-latură cilindru Reţeaua semancă conceptuală cub are-masă e-făcut-din Reţeaua semancă referenţială Cub1 Cub2 are-vol Cilindru1 e-făcut-din e-făcut-din 10 are-înălţime 5 are-rază 3 Subiectul 2: Rețele semantice descriptive Demoni Exemple Demoni ò Proceduri care ò nu se apelează ò se acvează singure când anumite condiţii pe care ei sunt pregăţi să le sesizeze sunt îndeplinite ò Stările unui demon: ò adormit ò disponibil (idle) ò acv Tranzițiile demonilor la îndeplinirea proces extern condiției proprii ADORMIT TREAZ ACTIV proces extern la terminare Demoni într-o rețea semancă computeVolCylinder computeMass masă computeVolCube are-vol (demon) are-masă(demon) are-vol are-masă (demon) e-făcut-din are-dens material densitate obiect-ﬁzic volum 2500 are-vol are-dens ﬁer lemn 0 8 2 4 corp-geometric are-dens 1000 are-înălţime dimensiune are-rază are-latură cilindru Reţeaua semancă conceptuală cub are-masă e-făcut-din Reţeaua semancă referenţială Cub1 Cub2 are-vol Cilindru1 e-făcut-din e-făcut-din 10 are-înălţime 9 are-rază 3 Demonul ComputeMass m=ρ*V procedure ComputeMass(x) begin ; află densitatea lui x: ?C: x ISA C xx ?R*: C R* densitate 1x1 ?y: x R* y 111 ; află volumul lui x: ?R*: C R* volum 2x2 ?y: x R* y 222 ; calculează masa ca densitate * volum: return y * y; 12 end Acvarea demonilor (demonul nu se acvează) Care este masa lui Cub1? ?C: Cub1 ISA C è C = cub computeMass masă ?R*: cub R* masă è R* = are-masă ?y: Cub1 are-masă y è y = 2500 are-masă(demon) are-masă e-făcut-din are-dens material densitate obiect-ﬁzic volum 2500 are-vol are-dens ﬁer lemn 0 8 2 4 corp-geometric are-dens 1000 are-înălţime dimensiune are-rază are-latură cilindru Reţeaua semancă conceptuală cub are-masă e-făcut-din Reţeaua semancă referenţială Cub1 Cub2 are-vol Cilindru1 e-făcut-din e-făcut-din 10 are-înălţime 11 are-rază 3 Demonul devine ACTIV Care este masa lui Cub2? ?CCub2: Cub2 ISA CCub2 è CCub2 = cub computeVolCylinder ?R*: cub R* masă è R* = are-masă computeMass ?y: Cub2 are-masă y è nil è masă computeVolCube are-vol ACTIV demonul din vârful relației (demon) are-masă(demon) are-masă… are-vol are-masă (demon) e-făcut-din are-dens material densitate obiect-ﬁzic volum 2500 are-vol are-dens ﬁer lemn 0 8 2 4 corp-geometric are-dens 1000 are-înălţime dimensiune are-rază are-latură cilindru Reţeaua semancă conceptuală cub are-masă e-făcut-din Reţeaua semancă referenţială Cub1 Cub2 are-vol Cilindru1 e-făcut-din e-făcut-din 10 are-înălţime 12 are-rază 3 Demonul ComputeMass e acv! cub2 procedure ComputeMass(x) m=ρ*V begin ; află densitatea lui x: ?C: x ISA C xx ?R*: C R* densitate è C = cub 1x1 ?y: x R* yx 111 ; află volumul lui x:è R1* = e-făcut-din are-dens ?R*: C R* volum è y1 = cub2 e-făcut-din are-dens = 0 8 2x2 ?y: x R* y 222 ; calculează masa ca densitate * volum: è R2* = are-vol return y * y; 12 endè y2: cub2 are-vol y2 y2 = 1000 return 0 8 * 1000 Demoni într-o rețea semancă Care este masa cilindrului 1? ?CCilindr: Cilindru1 ISA CCilindrè u1u1 CCilindr= cilindru computeVolCylinder u1 computeMass ?R*: cilindru R* masă è R* = are-masă masă computeVolCube are-vol ?y: Cilindru1 are-masă y è nil (demon) are-masă(demon) èACTIV demonul are-vol are-masă (demon) computeMass(cilindru1) e-făcut-din are-dens material densitate obiect-ﬁzic volum 2500 are-vol are-dens ﬁer lemn 0 8 2 4 corp-geometric are-dens 1000 are-înălţime dimensiune are-rază are-latură cilindru Reţeaua semancă conceptuală cub are-masă e-făcut-din Reţeaua semancă referenţială Cub1 Cub2 are-vol Cilindru1 e-făcut-din e-făcut-din 10 are-înălţime 14 are-rază 3 Demonul ComputeMass e acv! Cilindru1 procedure ComputeMass(x) m=ρ*V begin ; află densitatea lui x: ?C: x ISA Cè Cx = cilindru xx ?R*: C R* densitate 1x1è R* = e-făcut-din are-dens ?y: x R* y1 111 = Cilindru1 e-făcut-din are-dens = 2 4 ; află volumul lui x:è y1 ?R*: C R* volum è R2*: Cilindru R2* volum R2* = are-vol 2x2 ?y: x R* y 222è y2: Cilindru1 are-vol y2 nil è ; calculează masa ca densitate * volum: return y * y; 12 endreturn 0 8 * 1000 = 800 Subiectul 3: Ontologii Ce sunt OWL, Protégé? Ontologies • Rich conceptual schemas: – give formally defined meanings to the terms used in annotations, transforming them into semantic annotations – “Ontologies serve as metadata schemas, providing a controlled vocabulary of concepts, each with explicitly defined and machine- processable semantics By defining shared and common domain theories, ontologies help people and machines to communicate concisely—supporting semantics exchange, not just syntax Hence, the Semantic Web’s success and proliferation depends on quickly and cheaply constructing domain-specific ontologies ” From: A Maedche and S Staab Ontology learning for the semanc web IEEE Intelligent Systems, 16(2):72–79, 2001 Ontology ò The study of ontology ò traced back to the work of Plato and Aristotle ò development of hierarchical categorisaons of diﬀerent kinds of enes and their disnguishing features: ò the well known “tree of Porphyry” idenﬁes animals and plants as sub-categories of living things disnguished by animals being sensive, and plants being insensive Plasarea conceptului bone într-o ontologie hp://www ontobee org/ontology/AEO?iri=hp://purl obolibrary org/obo/AEO 0000085 OWL – un limbaj de descriere a ontologiilor ò The World Wide Web Consorum (W3C) set up a standardisaon working group to develop a standard for a web ontology language => OWL ontology language standard ò OWL is based on Descripon Logics (DLs): a family of logic- based knowledge representaon formalisms that are descendants of Semanc Networks and KL-ONE, but that have a formal semancs based on ﬁrst order logic Basic things in OWL Concepts (classes) Instances (individuals) Properes (roles) Ian Horrocks: Ontologies and the Semanc Web Protégé ò Mediu online de construire și editare de ontologii și creare de sisteme inteligente ò Protégé Desktop supports creaon and eding of one or more ontologies in a single workspace via a completely customizable user interface Visualizaon tools allow for interacve navigaon of ontology relaonships Advanced explanaon support aids in tracking down inconsistencies Refactor operaons available including ontology merging, moving axioms between ontologies, rename of mulple enes, and more hps://protege stanford edu/ Protégé Subiectul 4: Web-ul semantic Dați un exemplu de interogare care nu poate fi rezolvată de un motor de căutare precum Google, dar ar putea fi rezolvată prin raționament în web-ul semantic Sugerați o soluție la întrebare Semanc Web ò The goal of semanc web research: to allow the vast range of web-accessible informaon and services to be more eﬀecvely exploited by both humans and automated tools ò Exploitaon of the vast web ò through RDF and OWL: standard formats for the sharing and integraon of data and knowledge—the laer in the form of rich conceptual schemas called ontologies Examples of queries that cannot be answered by the actual web search engines ò The list of presidents of EU countries ò List of EU countries: ò hps://europa eu/european-union/about-eu/countries/member- countries en ò List of presidents of countries: ò hps://en wikipedia org/wiki/ List of current heads of state and government) Examples of queries… ò German writers contemporary with Beethoven ò a book: Music and Literature in German Romancism, by Siobhán Donovan and Robin Ellio ò abstract, presented at hp://www jstor org/stable/10 7722/j c81t1f ò an Wikipedia arcle: Beethoven and his contemporaries ò but mainly composers, at hps://en wikipedia org/wiki/Beethoven and his contemporaries German writers contemporary with Beethoven ò One possible soluon: ò Beethoven has lived between T1 and T2 ò German wriers borned between T1-20 and T2-20 Examples of queries… • Classical example of a semantic web application: – an automated travel agent that, given various constraints and preferences, would offer the user suitable travel or vacation suggestions – key feature of such a “software agent”: it would not simply exploit a predetermined set of information sources, but would search the web for relevant information in much the same way that a human user might do when planning a vacation Key idea behind the semanc web ò Address the problem of oﬀering automated reasoning by giving the machine accessible semancs to annotaons ò Achieved through ontologies ò Areas: ò knowledge representaon and reasoning, databases, computaonal linguiscs, computer vision, agent systems Subiectul 5: Tehnologiile limbajului scris Dați exemple de prelucrări la nivel subsintactic Tehnologiile limbajului scris ò Analiza şi înţelegerea limbajului ò prelucrări sub-sintacce ò unităţile lexicale ò graniţele de frază ò granițele de propoziții ò partea de vorbire şi marca morfologică ò lema ò numele de entăţi ò grupurile (nominale, verbale, prepoziţionale etc ) şi atracţiile lexicale (colocaţii) 32 Instrumente de bază în PLN ò Tokenizer: determină granițele unităților lexicale ò intrare: text (șir de caractere) ò ieșire: cuvânt ò cum: prin expresii regulate 33 33 Instrumente de bază în PLN ò POS-Tagger: echetare la parte de vorbire (dezambiguizare morfosintaccă) ò intrare: cuvânt ò ieșire: cuvânt ò cum: exploatând frecvențele de apariție a anumitor secvențe de părți de vorbire => opmizare globală a secvențelor de echete The saw made noise DET V N N N V 34 Instrumente de bază în PLN ò Lemazator: determină forma de bază a cuvintelor ò intrare: word ò ieșire: word ò cum: pe baza unui dicționar de leme și exploatând frecvențe de apariție a secvențelor de leme => opmizare globală The saw made noise the saw made noise see make 35 Instrumente de bază în PLN ò NP-Chunker: detectează grupuri nominale ò intrare: secvențe de elemente ò ieșire: ò cum: aplicând expresii regulate 36 Instrumente de bază în PLN ò NER (name enty recogniser): recunoaște și clasiﬁcă nume de entăți ò intrare: text ò ieșire: ò cum: pe bază de expresii regulate și liste foarte mari de nume de entăți specializate pe limbi (gazeteers) 37 Subiectul 6: Nivelul sintactic în analiza limbajului scris Dați un exempu de propoziție ambiguă sintactic și desenați arborii de analiză Ambiguităţi sintacce Maria priveşte calul cu ochelari S S VP NP VP NP NP NP PP PP NP NP priveşte Maria calul cu ochelari priveşte Maria calul cu ochelari 39 Subiectul 7: Puneți în evidență relații anaforice și semantice în textul următor: “Vreme de patruzeci de ani viața Ellei Rubinstein fusese ca o apă stătătoare… Soțul ei, David, era un dentist de succes…” Relații de rudenie: exemplu - Vreme de patruzeci de ani viața Ellei Rubinstein1 fusese ca o apă stătătoare… Soțul ei1, David, era un denst de succes… Apoziție: Rel Per-Xpr, Per-Y, => on,gen marriage(antecedent(X):person[sex:?], Y:person[sex:?]) marriage(Ella Rubistein:person[sex:f], David:person[sex:m]) 41 Relații anaforice • coref • coref-interpret • member-of, has-as-member (inverse) • isa, class-of (inverse) • part-of, has-as-part (inverse) • subgroup-of, has-as-subgroup (inverse) • has-name, name-of (inverse) 1:[Acteea] 2:[tânăra libertă] => coref 1:[mâna 2:[lui] dreaptă] => part-of 42 Relații de rudenie • parent-of • child-of (inverse of parent-of) • grandparent-of and grandchild-of (inverse) • sibling (symmetrical) • ant-uncle-of, nephew-of (inverse relation) • cousin-of (symmetrical) • spouse-of (symmetrical) • unknown 1:[celui de-al doilea soț 2:[al Popeii]] => spouse-of 1:[sora lui 2:[Petronius]] => sibling-of 43 Subiectul 8: Jocuri Algoritmul MIN-MAX Simplificarea ALPHA-BETA Evaluarea: de jos în sus O dezvoltare a spaţiului de joc pe o adâncime de 2 duce la concluzia 1 că MAX alege mutarea cea mai jucătorul care joacă primul are pentru el bunăo şansă de câştig în plus dacă ocupă centrul -1-2 1 MAX 1 MIN 0 11 2 -1 1 0 -1 te: MIN alege MAX gândeş0 mutarea cea mai bună-2-2 -1 0 pentru el = cea mai proastă pentru mine Metoda MIN-MAX function min-max(state, player, depth) begin if (depth = 0) then return score(state); val = worst(player); while (mai sunt stări de generat) begin generez o stare -> s; val s; newval reia execuția de acolo! ò nu se regăsește => construiește un nou plan cu această stare ca stare inițială! => execută planul! Subiectul 11: Arhitectura unui sistem de generare de teste, euristici și măsuri de aliniere a termenilor în fuziunea ontologiilor Proiectul: o arhitectură Fuziunea de ontologii – deﬁniție ò Procesul de fuziune ontologică primește în intrare două (sau mai multe) ontologii sursă și returnează o ontologie care combină ontologiile sursă date Gerd Stumme, Alexander Maedche Ontology Merging for Federated Ontologies on the Semanc Web Abordări • Abordările se bazează pe euristici de potrivire sintactică și semantică care derivă din comportamentul inginerilor ontologi atunci când se confruntă cu sarcina de a îmbina ontologii, i e se simulează comportamentul uman • Tehnici statistice, care judecă similaritatea conceptelor și asemănarea brută a instanțelor, prin metrici de șiruri textuale și cunoștințe de natură semantică Cum se pot combina termenii? ò Fiind dați doi termeni apropiați, câte unul din ﬁecare ontologie: ò Cei doi termeni sunt echivalenți è ei pot ﬁ direct aliniați; Ax Ay m Ay AyAyAyAy1 Ay2 Ay3 1 2 3 Cum se pot combina termenii? ò Fiind dați doi termeni, câte unul din ﬁecare ontologie: ò Un termen este mai general decât celălalt è termenul mai speciﬁc (și toți subordonații, posibil și frații lui) pot ﬁ integrați sub termenul mai general; Ay Ay Ax 1 m Ax1 AyAyAy2 Ay3 2 3 AxAx 2 3 AxAx 2 3 Cum se pot combina termenii? • Fiind dați doi termeni, câte unul din fiecare ontologie: – Termenii sunt incompatibili (i e , identificarea acestora ar cauza probleme de definire și relaționale între ceilalți termeni) - caz în care: (1) unul dintre termeni trebuie respins și nu trebuie încorporat, (2) unul dintre termeni și alții care depind de el trebuie să fie redefiniți, (3) trebuie creată o "microteorie" separată, în care termenii și toți ceilalți termeni care depind de ea există în paralel (4) poate fi încorporată o versiune mai slabă a termenului infracțional, fără definițiile sau relațiile care au cauzat inconsecvența Sugesi de eurisci de aliniere 1 Potriviri pe șiruri de litere, e g : ò Potriviri ale numelor de concepte (cognate matching): nume suﬁcient de asemănătoare (în aceeași limbă) sunt dovezi că dezvoltatorii consideră conceptele similare ò Potriviri în deﬁniții (prin procesare de text și măsuri de suprapuneri): deﬁniții similare în limbaj natural ar trebui ﬁe considerate, de asemenea, dovezi ale similarității conceptelor Sugesi de eurisci de aliniere 1 Potriviri pe șiruri de litere, e g : ò Potriviri ale numelor de concepte (cognate matching): nume suﬁcient de asemănătoare (în aceeași limbă) sunt dovezi că dezvoltatorii consideră conceptele similare ò Potriviri în deﬁniții (prin procesare de text și măsuri de suprapuneri): deﬁniții similare în limbaj natural ar trebui ﬁe considerate, de asemenea, dovezi ale similarității conceptelor Sugesi de eurisci de aliniere 2 Potrivirile ierarhice exploatează structura de taxonomizare a ontologiilor Ele includ: ò Filtrarea ambiguității prin superconcepte partajate: atunci când un concept poate ﬁ aliniat la mai multe alternave, se iau în considerare cele ale căror superconcepte sunt cumva aliniate la superconceptele conceptului țintă ò Măsuri bazate pe distanțe semance (număr de legături) (v (Agirre et al , 1994)) Măsuri de aliniere • Potrivire de nume (cognate match): compară numele N1 și N2 ale două concepte – Consideră subșiruri descrescătoare ale lui N1, tăind din stânga Numele formate din cuvinte compuse sunt împărțite în cuvinte separate, se întoarce scorul maxim Numele mai mici de 3 litere sunt ignorate • NAMESCORE: = numărul de litere potrivite la pătrat + 20 de puncte dacă cuvintele sunt exact egale sau 10 puncte dacă cuvintele coincid la sfârșit Măsuri de aliniere ò Potriviri pe deﬁniții: compară deﬁnițiile în engleză D1 și D2 ale două concepte Mai întâi, ambele deﬁniții sunt separate in cuvinte separate (se îndepărtează apostroafele, limioarele de unire etc ) și toate cuvintele sunt lemazate ò deﬁniția lui M@FOOD: ("any" "substance" "that" "can" "be" "metabolized" "organism" "give" "energy" "build" "ssue") ò apoi, se calculează 3 valori: ò strength = raportul dintre numărul de cuvinte care apar în ambele deﬁniții și numărul de cuvinte ale deﬁniției cele mai scurte, ò reliability = numărul de cuvinte comune, ò defscore = strength * reliability: ò DEFSCORE := (Shared(D1,D2) / min{D1,D2})*Shared(D1,D2) Măsuri de aliniere • Potrivire TAXONOMICĂ (între ontologiile SENSUS și MIKROKOSMOS): pentru un anumit concept SENSUS, colectează toate conceptele din MIKROKOSMOS care sunt "mai apropiate" de 10 link-uri de el Algoritmul traversează taxonomia atât în direcțiile superconcept cât și în subconcepte – Scorul de potrivire este dat de inversa link-distanței: – TAXSCORE := 1 / number-of-links Combinarea scorurilor • Caracteristicile formulelor de combinare: – să crească cu valori în creștere ale NAME, DEF și TAX – să normalizeze scorurile euristicilor – să diminueze tendința scorurilor NAME de a crește rapid – să atenuarea tendința scorurilor de TAXONOMIE de diminuare rapidă – să întoarcă un scor nenul dacă cel puțin o euristică întoarce un scor nenul • SCORE := sqrt(NAMESCORE) * DEFSCORE * (10 * TAXSCORE) cu grija că dacă NAMESCORE sau DEFSCORE sunt zero, ele sunt înlocuite prin 1, și dacă TAXSCORE e 0, el e înlocuit prin 0 01 Uzual, scorurile de aliniere se plasează în scara 0 – 16 Subiectul 12: Patternuri lexicale pentru determinarea relației de hiponimie/hipernimie, patternuri de generare de teste Paernuri lexicale NP0 such as {NP1, NP2 (and | or)} NPn implică for all NPi 1 hyponym("author", "Herrick") hyponym("author", "Goldsmith") hyponym("author", "Shakespeare") Paernuri lexicale NP {, NP} * {,} or other NP Bruises, wounds, broken bones or other injuries => hyponym("bruise", "injury") hyponym ("wound", "injury “) hyponym("broken bone", "injury") Paernuri lexicale NP {, NP}* {,} and other NP temples, treasuries, and other important civic buildings => hyponym("temple", "civic building") hyponym("treasury ", "civic building") Paernuri lexicale NP {,} including {NP {,}} * {or | and} NP All common-law countries, including Canada and England => hyponym("Canada", "common-law country") hyponym ("England", "common-law country") Paernuri lexicale NP {,} especially {NP ,}* {or] and} NP most European countries, especially France, England, and Spain => hyponym("France", "European country") hyponym("England", "European country") hyponym("Spain", "European country") Paernuri în generarea testelor Žitko B, Stankov S, Rosić M, Grubišić A (2009) Dynamic test generaon over ontology-based knowledge representaon in authoring shell Expert Systems with Applicaons 36:8185–8196 ò Teste generate pe baza cunoșnțelor de domeniu exprimate în ontologii OWL: ò un număr de șabloane deﬁnite pentru întrebări sunt ulizate de sistem pentru a genera elementele de testare Exemple de patternuri care generează teste A Care dintre următoarele elemente: shuffle(someOf(desc(B)), someOf(desc(siblingOf(B))) sunt B-uri? B C B1 B2 B3 C1 C2 Exemple de patternuri care generează teste VP1B Care dintre următoarele propietăți: setOfPropertiesOf(B) caracterizează property P1 random(descOf(B)) și care este property P2 valoare ei? B VP2 B B1 B2 B3 VP2property P2 B2 